智能论文笔记

Liver Segmentation using Turbolift Learning for CT and Cone-beam C-arm Perfusion Imaging

Hana Haseljić , Soumick Chatterjee , Robert Frysch , Vojtěch Kulvait , Vladimir Semshchikov , Bennet Hensen , Frank Wacker , Inga Brüsch , Thomas Werncke , Oliver Speck

分类：计算机视觉 | 机器学习

2022-07-20

发现采用时间分离技术（TST）的基于模型的重建可以使用C臂锥束计算机断层扫描（CBCT）改善肝脏的动态灌注成像。要使用从CT灌注数据中提取的先验知识应用TST，应从CT扫描中准确分割肝脏。需要对主要和基于模型的CBCT数据进行重建，以正确可视化和解释灌注图。这项研究提出了Turbolift Learning，该学习按照培训CT，CBCT，CBCT，CBCT TST的顺序训练多尺度关注的多尺度注意力，UNET串行序列上的不同肝脏细分任务 - 使先前的培训作为前培训作为预训练阶段的阶段随后的问题 - 解决培训数据集数量有限的问题。对于CBCT TST的肝脏分割的最终任务，提议的方法的总骰子得分为0.874 $ \ pm $ 0.031和0.905 $ \ pm $ \ $ \ $ 0.007，分别为6倍和4倍的交叉验证实验 - 获得统计上显着的改进 - 在模型上，该模型仅接受该任务。实验表明，涡轮增压不仅提高了模型的整体性能，而且还使其与源自栓塞材料和截断物品的人工制品具有稳健性。此外，深入分析确认了分割任务的顺序。本文显示了从CT，CBCT和CBCT TST分割肝脏的潜力，从可用的有限培训数据中学习，将来可能会用于可视化和评估灌注图的肝病评估。。

translated by 谷歌翻译

Synthetic Data for Feature Selection

Firuz Kamalov , Hana Sulieman , Aswani Kumar Cherukuri

分类：机器学习

2022-11-06

Feature selection is an important and active field of research in machine learning and data science. Our goal in this paper is to propose a collection of synthetic datasets that can be used as a common reference point for feature selection algorithms. Synthetic datasets allow for precise evaluation of selected features and control of the data parameters for comprehensive assessment. The proposed datasets are based on applications from electronics in order to mimic real life scenarios. To illustrate the utility of the proposed data we employ one of the datasets to test several popular feature selection algorithms. The datasets are made publicly available on GitHub and can be used by researchers to evaluate feature selection algorithms.

translated by 谷歌翻译

Domain Knowledge in A*-Based Causal Discovery

Steven Kleinegesse , Andrew R. Lawrence , Hana Chockler

分类： (统计)机器学习 | 人工智能 | 机器学习

2022-08-17

因果发现已成为希望从观察数据中发现因果关系的科学家和从业者的重要工具。尽管大多数先前的因果发现方法都隐含地假设没有专家领域知识可用，但从业者通常可以从先前的经验中提供此类域知识。最近的工作已将域知识纳入基于约束的因果发现中。但是，大多数基于约束的方法都假定因果忠诚，这在实践中经常被违反。因此，人们对基于精确搜索得分的因果发现方法的重新关注，这些方法不假定因果关系，例如基于*基于*的方法。但是，在领域知识的背景下，没有考虑这些方法。在这项工作中，我们专注于有效地将几种类型的领域知识整合到基于*的因果发现中。在此过程中，我们讨论并解释了域知识如何减少图形搜索空间，然后对潜在的计算收益进行分析。我们通过有关合成和真实数据的实验来支持这些发现，表明即使少量领域知识也可以显着加快基于*基于*的因果关系并提高其绩效和实用性。

translated by 谷歌翻译

A Study of Demographic Bias in CNN-based Brain MR Segmentation

Stefanos Ioannou , Hana Chockler , Alexander Hammers , Andrew P. King

分类：计算机视觉

2022-08-13

卷积神经网络（CNN）越来越多地用于自动化磁共振（MR）图像中脑结构的分割，以进行研究。在其他应用中，CNN模型在训练集中的代表性不足时已显示出对某些人口组的偏见。在这项工作中，我们研究了CNN大脑MR分割模型是否有可能在接受不平衡训练集训练时遏制性别或种族偏见。我们使用白人受试者中不同水平的性不平衡训练快速冲浪模型的多个实例。我们分别评估白人男性和白人女性测试集以评估性别偏见的性能，并在黑人男性和黑人女性测试套装上评估它们，以评估潜在的种族偏见。我们发现分割模型性能中的重大性别和种族偏见效应。这些偏见具有很强的空间成分，一些大脑区域表现出比其他大脑更强的偏见。总体而言，我们的结果表明，种族偏见比性偏见更为重要。我们的研究表明，在为基于CNN的大脑MR分割的训练集时考虑种族和性别平衡的重要性，以避免通过有偏见的研究研究结果来维持甚至加剧现有的健康不平等。

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

Slot-VPS: Object-centric Representation Learning for Video Panoptic Segmentation

Yi Zhou , Hui Zhang , Hana Lee , Shuyang Sun , Pingjun Li , Yangguang Zhu , ByungIn Yoo , Xiaojuan Qi , Jae-Joon Han

分类：计算机视觉 | 机器学习

2021-12-16

视频Panoptic semonation（VPS）旨在为每个像素分配类标签，唯一地分割和识别所有帧的所有对象实例。经典解决方案通常将VPS任务分解为多个子任务，并利用多个代理（例如框和掩码，中心和偏移）来表示对象。然而，这种鸿沟和征服策略需要在空间和时间域中进行复杂的后处理，并且易于来自代理任务的失败。在本文中，灵感来自以对象为中心的学习，它学习紧凑且强大的对象表示，我们呈现了Slot-VPS，这是此任务的第一个端到端框架。我们在视频中编码所有Panoptic实体，包括前景实例和后台语义，其中包含称为Panoptic插槽的统一表示。通过提出的视频Panoptic Retriever检索并将相干的时空对象的信息检索并编码到Panoptic插槽中，使其能够以统一的方式本地化，段，区分和关联对象。最后，输出Panoptic插槽可以直接转换为视频中Panoptic对象的类，掩码和对象ID。我们开展广泛的消融研究，并展示了我们对两个基准数据集，CityCAPE-VPS（\ Texit {Val}和测试集）和Viper（\ Texit {val}集）的有效性，实现了新的最先进的性能分别为63.7,63.3和56.2 VPQ。

translated by 谷歌翻译

Causal policy ranking

Daniel McNamee , Hana Chockler

分类：人工智能 | 机器学习

2021-11-16

即使对于简单的任务，通过强化学习（RL）培训的政策往往非常复杂。在以$ N $ Time步骤的一集中，策略将使有关采取行动的$ N $决定，其中许多可能对观察者似乎不直观。此外，目前尚不清楚这些决策直接有助于实现奖励以及他们的贡献有多重要。鉴于训练有素的政策，我们提出了一种基于反事实推理的黑匣子方法，估计这些决定对奖励达到的因果效应，并根据本估计划分决定。在这项初步工作中，我们将措施与替代，非因果，排名程序进行比较，突出基于因果关系的策略排名的好处，并讨论将因果算法整合到RL代理政策的解释中的潜在未来工作。

translated by 谷歌翻译